這是本系列文章的第一篇, 主要是介紹之後要使用的工具及Data transformation的架構.

工具

  1. 在開發工具方面, 推薦使用的IDE是 PyCharm, 它是JetBrains公司下的產品, 整合了Git, DB, CLI, 單一介面就可以同時做很多事情. 如果預算充足, 會更推薦同團隊的另一個 IDE-IntelliJ.
  2. 環境推薦使用 Docker, 搭配docker-compose, 可以一次把所需要的環境都建起來.
  3. Git推薦使用 BitBucket, 可以搭配 JIRA一次做好ticket管理. JIRABitBucket都是 Atlassian的產品.
  4. Unix環境為Ubuntu:20.04
  5. Database推薦使用 PostgreSQL, 連接DB的Tool, 推薦使用 PyCharm 或 IntelliJ 或 DataGrip.

  6. Scheduler推薦使用 Apache Airflow, 搭配的DB為MariaDB.

目標

我們打算透過上述的工具, 建立一個Data Transformation的框架.








你可能感興趣的文章

Web開發學習筆記15 — 呼叫堆疊、同步與非同步、Promise、Async/Await、Conditional ternary operator

Web開發學習筆記15 — 呼叫堆疊、同步與非同步、Promise、Async/Await、Conditional ternary operator

Sequence to Sequence

Sequence to Sequence

Week1: CLI 和 Git 筆記

Week1: CLI 和 Git 筆記






留言討論